مقدمه: در این مقاله، خوشه بندی رگرسیونی (Regression clustering) با استفاده از فرایند دیریکله (Dirichlet process) جهت به دست آوردن بینشی جامع از الگوی سلامت کودکان و نوجوانان بررسی شده در مطالعات ملی ایران، در نظر گرفته شد. در این رویکرد به خوشه بندی، ضمن این که تاثیر عوامل مزاحم، حذف و تحلیل های دقیق تری از وضعیت افراد به دست می آید، تعداد خوشه ها و الگوهای موجود در داده ها نیز تخمین زده می شود. در این پژوهش، خوشه بندی افراد نمونه از نظر دو شاخص چربی خون و قند خون، مدنظر قرار گرفته و میزان تاثیر شاخص تن سنجی (Anthropometric)، رده سنی و جنسیت بر نحوه خوشه بندی افراد، مورد ارزیابی قرار گرفته است.روش ها: به منظور برآورد پارامترهای مجهول مدل، با رویکرد بیز (Bayesian approach) به مساله، از روش های شبیه سازی مونت کارلوی زنجیر مارکفی (Markov chain Monte Carlo) در نرم افزار اپن باگز (Open Bugs) استفاده شده است. به منظور به دست آوردن بینش مناسب در رابطه با تعداد الگوهای افراد در معرض خطر بیماری های قلبی- عروقی و دیابت، بر مبنای شاخص چربی خون و قند خون، از فرایند دیریکله استفاده شده است.یافته ها: تاثیر متغیرهای شاخص تن سنجی، رده سنی و جنسیت بر خوشه بندی با وارد کردن آن ها به عنوان متغیرهای توضیحی در مدل رگرسیونی و درنتیجه حذف اثر آنها بر خوشه بندی، مورد بررسی قرار گرفت. نتایج منجر به تشکیل سه خوشه شد، به طوری که درصد افراد تخصیص یافته به خوشه های 1 تا 3، به ترتیب برابر با 47% (1310 نفر)، 4% (112 نفر) و 49% (1366 نفر) شد. با بررسی چارک های متغیرهای قندخون و چربی خون، نتیجه می شود که افراد قرار گرفته در خوشه 3 که حجم بزرگی از کودکان و نوجوانان نمونه را تشکیل می دهند، از لحاظ شاخص چربی خون و نیز قندخون، افراد در معرض خطر محسوب می شوند. هم چنین افراد خوشه اول دارای قندخون و شاخص چربی خون نرمال و افراد خوشه دوم دارای قندخون در محدوده خطر و شاخص چربی خون نرمال هستند.نتیجه گیری: در خوشه بندی کودکان و نوجوانان از لحاظ دو متغیر قندخون و شاخص چربی خون، متغیرهای جنسیت، رده سنی و شاخص تن سنجی عوامل تاثیرگذار بر تعداد و ساختار خوشه ها هستند. هم چنین، افراد نمونه به سه خوشه، افراد با وضعیت نرمال، افراد در ریسک ابتلا به بیماری دیابت و افراد در ریسک بیماری های قلبی- عروقی و نیز دیابت، تقسیم بندی شدند.